Machine Learning Activation Functions (ReLU, Sigmoid, Tanh) গাইড ও নোট

512

Activation Functions হলো নিউরাল নেটওয়ার্কে ব্যবহৃত একটি গুরুত্বপূর্ণ উপাদান যা একটি নিউরনের আউটপুট হিসাব করতে সহায়ক। এটি ইনপুটের সাথে সম্পর্কিত সিদ্ধান্ত তৈরি করে এবং মডেলটিকে non-linear (অলিনিয়ার) আচরণ শেখানোর ক্ষমতা দেয়, যাতে মডেলটি জটিল প্যাটার্ন বা সম্পর্ক শিখতে পারে। Activation functions মূলত neural networks এবং deep learning models এর মধ্যে একটি অতীব গুরুত্বপূর্ণ ভূমিকা পালন করে।

তিনটি সাধারণভাবে ব্যবহৃত activation function হলো: ReLU, Sigmoid, এবং Tanh।

১. ReLU (Rectified Linear Unit)

ReLU হলো সবচেয়ে জনপ্রিয় এবং দ্রুতগতির activation function যা neural networks এবং deep learning মডেলগুলিতে ব্যবহার হয়। এটি একটি non-linear function এবং এটি ইনপুট ভ্যালুকে positive রাখে এবং negative ইনপুটগুলোর জন্য zero রিটার্ন করে।

ReLU ফাংশনের গাণিতিক রূপ:

$ReLU(x) = \max(0, x)$

এটি যদি ইনপুট পজিটিভ হয়, তাহলে সেটি ইনপুটের সমান আউটপুট দিবে, এবং যদি ইনপুট নেগেটিভ হয়, তবে এটি শূন্য প্রদান করবে।

উদাহরণ:

Input: [-1, 2, -3, 4]
Output: [0, 2, 0, 4]

সুবিধা:

দ্রুত গণনা (computationally efficient)।
মডেলটির Vanishing Gradient Problem কমাতে সাহায্য করে।
Sparse Activation: বেশিরভাগ নিউরন একে কাজে লাগায় না, ফলে এটি দক্ষতা বাড়ায়।

অসুবিধা:

Dying ReLU Problem: যদি ইনপুট সবসময় নেগেটিভ হয়, তবে নিউরনটি কখনই "অ্যাকটিভ" হয় না, যার ফলে তা পুরোপুরি নিষ্ক্রিয় হয়ে যেতে পারে।

২. Sigmoid

Sigmoid একটি ক্লাসিক activation function যা একটি S-আকৃতির গ্রাফ তৈরি করে। এটি ইনপুট মানকে ০ এবং ১ এর মধ্যে probability score রূপান্তরিত করে। Sigmoid ফাংশন সাধারণত binary classification সমস্যায় ব্যবহার করা হয় যেখানে আউটপুট দুটি শ্রেণীতে বিভক্ত থাকে।

Sigmoid ফাংশনের গাণিতিক রূপ:

$Sigmoid(x) = \frac{1}{1 + e^{-x}}$

এখানে e হলো ন্যাচারাল লগারিদমের ভিত্তি (2.71828…) এবং x হলো ইনপুট ভ্যালু।

উদাহরণ:

Input: [-1, 0, 1]
Output: [0.2689, 0.5, 0.7311]

সুবিধা:

আউটপুট 0 থেকে 1 এর মধ্যে থাকে, যা probability হিসেবে ব্যাখ্যা করা যায়।
সহজে ব্যাখ্যাযোগ্য, বিশেষ করে বায়নারি ক্লাসিফিকেশনে।

অসুবিধা:

Vanishing Gradient Problem: যদি ইনপুট ভ্যালু খুব বড় বা খুব ছোট হয়, তাহলে গ্রেডিয়েন্ট খুব ছোট হয়ে যায় এবং backpropagation প্রক্রিয়া ধীর হতে পারে।
আউটপুট শুধুমাত্র 0 থেকে 1 এর মধ্যে সীমাবদ্ধ থাকে, তাই এটি non-zero centered।

৩. Tanh (Hyperbolic Tangent)

Tanh হল একটি S-আকৃতির activation function যা Sigmoid এর মতোই কাজ করে, তবে এর আউটপুট -1 থেকে 1 এর মধ্যে থাকে। এটি zero-centered এবং এই কারণে এটি কিছু ক্ষেত্রে Sigmoid এর তুলনায় কার্যকরী হতে পারে।

Tanh ফাংশনের গাণিতিক রূপ:

$Tanh(x) = \frac{e^{x} - e^{-x}}{e^{x} + e^{-x}}$

উদাহরণ:

Input: [-1, 0, 1]
Output: [-0.7616, 0, 0.7616]

সুবিধা:

Zero-centered: Tanh ফাংশনের আউটপুট -1 থেকে 1 এর মধ্যে থাকে, ফলে এটি symmetrical এবং zero-centered।
Sigmoid এর চেয়ে দ্রুততর convergence (গ্রেডিয়েন্ট বৃহত্তর হওয়ায়)।

অসুবিধা:

Vanishing Gradient Problem: Tanh ফাংশনও একসময় ভ্যানিশিং গ্রেডিয়েন্ট সমস্যায় পড়তে পারে যখন ইনপুট ভ্যালু খুব বড় বা ছোট হয়।

তুলনা:

Feature	ReLU	Sigmoid	Tanh
Range	[0, ∞)	(0, 1)	(-1, 1)
Non-linearity	Yes	Yes	Yes
Computationally	Very Efficient	Less Efficient	Less Efficient
Vanishing Gradient	Less prone	More prone	More prone
Usage	Deep learning, hidden layers	Binary classification	Hidden layers, NLP models

উপসংহার:

ReLU হলো সবচেয়ে জনপ্রিয় activation function, যা সহজ এবং দ্রুত কাজ করে, তবে কখনও কখনও Dying ReLU সমস্যা দেখা দিতে পারে।
Sigmoid সাধারণত binary classification এর জন্য ব্যবহৃত হয়, কিন্তু Vanishing Gradient Problem এর কারণে এটি বড় মডেলগুলিতে ভালো পারফর্ম করে না।
Tanh একটি ভালো বিকল্প Sigmoid এর জন্য, বিশেষত যখন zero-centered output প্রয়োজন, তবে এটি এখনও Vanishing Gradient সমস্যা থেকে মুক্ত নয়।

প্রত্যেকটি activation function এর নিজস্ব সুবিধা এবং অসুবিধা রয়েছে, তাই উপযুক্ত activation function নির্বাচন করার সময় ডেটা, মডেল এবং প্রসেসিং এর প্রয়োজনীয়তা অনুযায়ী সঠিকটি বেছে নিতে হবে।

Content added By

SATT Academy

Deep Learning এবং Neural Networks এর ধারণা Gradient Descent এবং Backpropagation Feedforward এবং Backward Pass

Machine Learning Activation Functions (ReLU, Sigmoid, Tanh) গাইড ও নোট

১. ReLU (Rectified Linear Unit)

ReLU ফাংশনের গাণিতিক রূপ:

উদাহরণ:

সুবিধা:

অসুবিধা:

২. Sigmoid

Sigmoid ফাংশনের গাণিতিক রূপ:

উদাহরণ:

সুবিধা:

অসুবিধা:

৩. Tanh (Hyperbolic Tangent)

Tanh ফাংশনের গাণিতিক রূপ:

উদাহরণ:

সুবিধা:

অসুবিধা:

তুলনা:

উপসংহার:

Promotion

Satt AI

Hi, আমি SATT AI!

Machine Learning Activation Functions (ReLU, Sigmoid, Tanh) গাইড ও নোট

১. ReLU (Rectified Linear Unit)

ReLU ফাংশনের গাণিতিক রূপ:

উদাহরণ:

সুবিধা:

অসুবিধা:

২. Sigmoid

Sigmoid ফাংশনের গাণিতিক রূপ:

উদাহরণ:

সুবিধা:

অসুবিধা:

৩. Tanh (Hyperbolic Tangent)

Tanh ফাংশনের গাণিতিক রূপ:

উদাহরণ:

সুবিধা:

অসুবিধা:

তুলনা:

উপসংহার:

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!